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Oligonucleotidbank und Verfahren zur DNA-Sequenzierung 



Die Sequenzanalyse von Nucleinsauref ragmenten , insbesondere von 
DNA, ist als ein Schlusselverf ahren der modernen Biowissen- 
schaften und der modernen Bio technologie anzusehen. In letzter 
Zeit gerat rait der standigen Verfeinerung der Sequenzierungs- 
techniken auch die Analyse von ganzen, komplexen Genomen in den 
Bereich des Moglichen. 

Neben einigen weniger popularen Methoden werden heutzutage vor 
allera zwei grundsatzl ich unterschiedl iche Methoden zur Sequenz- 
analyse angewandt, und zwar 

- die Sequenzierung durch chemische Modi f izierung und Abbau 
(Maxam/Gilbert-Methode ) sowie 

- die Sequenzierung durch kontroll ierten Polymerase-Einbau 
unterschiedlicher Nucleotide (Sanger-Methode); vgl. beispiels- 
weise Gassen & Schafer, Sequenzbest immung von Nucle insauren und 
Proteinen, in: Gassen et al , Gentechnik, 2. Auflage, Gustav- 
Fischer-Verlag, 1987, Seite 241 ff. 

Die Sanger-Methode kann sowohl mit einzelstrangiger DNA, die 
speziell fur den Zweck der Sequenzierung hergestellt wird, als 
auch seit wenigen Jahren mit jeder ausreichend reinen doppel- 
strangigen DNA durchgefiihrt werden. Ein durchgehendes Wesens- 
raerkmal der Sanger-Methode bleibt jedoch unter anderem die Ab- 
hangigkeit der verwendeten Einbauenzyme ( DNA-Polymerasen ) sowohl 
von einer Matrize (Teraplat = zu sequenzierende DNA) als auch von 
einem Startmolekiil (Primer). Der Primer ist in der Regel ein 
kurzes, chemisch synthet is iertes Oligonucleotid , das in seiner 



WO 89/1 121 1 PCT/EP89/00579 

- 2 - 



ganzen Lange zu einem 3' von dem zu sequenzierenden DNA-Ab- 
schnitt gelegenen Teilstiick basenkomplementar ist: 



zu sequenzieren 



Primer 



3' 



Die Anhef tungsstelle ( Hybridisierungsstelle ) des Primers mu(3 
derart gewahlt sein, daS unter den experimentellen Bedingungen 
der Primer nur die gewtinschte und keine einzige weitere An- 
hef tungsstelle findet, um ein lesbares Sequenzierungsergebnis 
erreichen zu konnen. Die Spezifitat des Primers hangt direkt von 
seiner Lange und der Koraplexitat der im Experiment verwendeten 
DNA ab, Aus statistischen Erwagungen und praktischer Erfahrung 
ergibt sich, dafl Primer mit einer Kettenlange von bis zu 24 
Basen fur alle denkbaren Falle ausreichen sollten. 

Bei der Sequenzanalyse sehr langer DNA ( be ispielsweise bei Ge- 
nomsequenzierungen ) werden gegenwartig im wesentlichen zwei ver- 
schiedene Strategien verfolgt. 

Strategie 1: Die Ein-Pr imer-Methode . Hierbei wird die zu sequen- 
zierende DNA (je nach Verf ahrensvariante ) mehr oder weniger in 
Zuf allsf ragmente oder teilweise geordnete Fragmente zerlegt, 
wonach die Fragmente in ein und denselben Vektor inseriert 
werden. Nach Transformation von Zellen werden DNA-Praparationen 
von einzelnen Klonen hergestellt und der Sequenzanalyse unter- 
worfen. Da sich alle DNA-Praparationen maximal um die inserierte 
DNA unterscheiden, kann fur alle anstehenden Sequenzanalysen im 
Prinzip ein einziger Primer verwendet werden, der beispielsweise 
direkt neben der Insertionsstelle auf der Vektor-DNA hybridi- 
siert. Diesem Vorteil stehen jedoch auch erhebliche Nachteile 
gegenuber, 
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- denn da die Klone zufallig ausgesucht werden miissen, werden 
einzelne Abschnitte der Original-DNA sehr oft weit haufiger als 
notig sequenziert, und 

- schlieBlich klaffen in der mit Hilfe von geeigneten Computer- 
Programmen zu einer Gesamtsequenz geordneten Sammlung der Teil- 
sequenzierungsergebnisse haufig betrachtliche Lticken, da bei- 
spielsweise gewisse Abschnitte der zu analys ierenden Original- 
DNA "schwer klonierbar" sind. 

Strategie 2: Die Mehr-Primer-Methode . Die zu sequenzierende DNA 
wird hier nicht wie bei Strategie 1 nach der SchrotschuB-Me- 
thode, sondern gezielt progressierend analysiert. Der in einem 
Experiment noch sicher zu entschlusselnde Sequenzabschni tt dient 
zur Auswahl einer Primer-Anhef tungsstelle fiir das nachste Ex- 
periment und so fort. Der Vorteil dieser Methode liegt vor allem 
darin, daB unnotige Mehrf achsequenzanalysen wie bei der 
Strategie 1 vermieden werden. Der wohl wesentliche Grund, warum 
diese Methode nicht allein fiir die Analyse langer DNA-Abschnitte 
verwendet wird, liegt in der Beschrankung durch die gegenwartig 
verfiigbaren Methoden zur chemischen DNA-Synthese . 

Es hat nicht an Versuchen gefehlt, die jeweiligen Nachteile der 
oben beschriebenen Verfahren zu mildern, beispielsweise durch 
das "Multiplex-Sequencing" bei Strategie 1 und das simultane 
progressierende Sequenzieren von verschiedenen Stellen aus bei 
Strategie 2. Ein Weg, den wesentlichen Nachteil der Strategie 2 
ganz zu beseitigen, liegt theoretisch darin, eine Bank aller 
denkbaren Primer anzulegen. Dies ist jedoch durch direkte che- 
mische Synthese praktisch nicht moglich, da es allein 4 24 ver- 
schiedene Primer der Kettenlange 24 gibt. 

Erf indungsgemaB wird daher vorgeschlagen , kurzere, cheraisch syn- 
thetisierte Oligonucleotide zu verwenden. Da jede langere Se- 
quenz im Prinzip aus zwei oder mehr kiirzeren Sequenzen zusammen- 
setzbar ist, werden die dem gewunschten Primer entsprechenden 
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kurzen Oligonucleotide anstelle des gewiinschten Primers zu der 
zu sequenzierenden DNA gegeben und durch eine 

geeignete Prozedur, beispielsweise mit T4-DNA-Ligase , zu dem 
gewiinschten Primer zusammengef iigt • Die Sequenzierungsreaktion 
kann dann anschlieflend praktisch unter Standardbedingungen 
durchgef iihrt werden . 

Die der Erfindung zugrundeliegende Aufgabe wird durch die Gegen- 
stande der Anspruche gelost. 

Beispiel 1 

In typischen Experimenten wurden ca. 2,5 pMol DNA des Plasmids 
PTZ18R (Pharmacia-LKB) mit NaOH denaturiert, mit Ethanol ge- 
fallt, getrocknet und in Wasser aufgenommen. Die DNA-L6sung 
wurde mit je 2,5 pMol zweier verschiedener Oligonucleotidlosun- 
gen versetzt. Die Oligonucleotide der Kettenlange 8 (Octamere) 
waren derart gewahlt, daJ3 sie unmittelbar benachbart auf einem 
Abschnitt bekannter Nucleotidsequenz der Plasmid-DNA hybridi- 
sieren konnten. Das 5 f -Ende des im hybridisierten Zustand be- 
nachbart zum 3'-Ende des anderen Oligonucleotids gelegenen 
Octamers war zuvor nach gangigen Verfahren mit T4-Polynucleotid- 
Kinase und ATP phosphoryliert worden. Nach Einstellen der be- 
kannten Puf f erbedingungen fur Ligationen mit T4-DNA-Ligase und 
Versetzen mit 1 Einheit des Enzyms wurde die Losung (10 ul End- 
volumen) 4 h lang bei 15 °C inkubiert. Diese Ligationslosung 
wurde vor der Sequenzierung 5 min lang bei 37 °C aufbewahrt, um 
moglichst viele durch Ligation entstandene 16-mere und moglichst 
wenige 8-mere hybridisieren zu lassen. 

Die folgende Sequenzierung sollte dazu dienen, die Sequenz des 
gewahlten Vektors zu iiberprufen. Fur die Sequenzierungsreaktion 
nach dem Standardprotokoll der Firma United States Biochemical 
Corporation (USB) wurden 8 pi der Ligationslosung eingesetzt. 
Abweichend von diesem Protokoll wurde auf das "Annealing" von 
Templat und Primer verzichtet. 
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Sofern die genannte Phosphorylierung in Gegenwart von [gamma- 
32 P]ATP durchgefiihrt worden war, wurde auf die spatere 
Verwendung von [a- 32 P]dATP verzichtet. 
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Patent anspruche 



1. Oligonucleotidbank, urafassend alle denkbaren 4 6 verschie- 
denen hexameren Oligonucleotide. 

2. Oligonucleotidbank, umfassend alle denkbaren 4 7 verschie- 
denen heptameren Oligonucleotide. 

3. Oligonucleotidbank, umfassend alle denkbaren 4 8 verschie- 
denen octameren Oligonucleotide. 

4. Oligonucleotidbank, umfassend alle denkbaren 4 9 verschie- 
denen Oligonucleotide. 

5. Verfahren zur DNA-Sequenzierung nach der Mehr-Primer- 
Methode, dadurch gekennzeichnet, da0 man 

(a) bei der zu sequenzierenden DMA eine einzelstrangige 
Pr imeranhef tungsstelle bekannter Sequenz wahlt, 

(b) auf dieser Primeranhef tungsstelle unmittelbar benachbart 
zwei hexamere, heptamere oder octamere Oligonucleotide (bei- 
spielsweise einer Oligonucleotidbank gemaB einem der vorher- 
gehenden Anspruche 1 bis 4) hybridisiert und 

(c) ggf» gleichzeitig mit Stufe (b) oder nach Stufe (b) ein 
weiteres hexameres, heptameres oder octameres 01 igonucleotid 
(beispielsweise einer Oligonucleotidbank gemap einem der 
vorhergehenden Anspruche 1 bis 4) unmittelbar benachbart zu 
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einem der beiden anderen Oligonucleotide auf der Primeran- 
hef tungsstelle hybridisiert und 

(d) die Oligonucleotide zu einem Primer ligiert. 

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet , da{3 man 
auf der Primeranhef tungsstelle zwei Oligonucleotide hybridi- 
siert und miteinander zu einem Pra-Primer ligiert und erst 
danach auf der Primeranhef tungsstelle ein drittes Oligomeres 
hybridisiert und mit dem Pra-Primer ligiert. 

7. Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, 
da{3 man fur die Primerbildung hexamere, heptamere und/oder 
octamere Oligonucleotide verwendet . 

8. Verfahren nach einem der vorhergehenden Anspriiche , dadurch 
gekennzeichnet , da(3 roan Oligonucleotide verwendet, die an ihrem 
S'-Ende, sofern dieses Ende mit einem benachbarten Oligonucleo- 
tid rait Hilfe von T4-DNA-Ligase ligiert werden soil, phosphory- 
liert sind. 

9. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, da0 man nach der Ligation und vor der Sequen- 
zierung nicht zum gewiinschten Primer ligierte Oligonucleotide 
durch Warraebehandlung entfernt. 
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Oligonucleot idbank und Verfahren zur DNA-Sequenzierung 



Die Sequenzanalyse von Nucleinsauref ragmenten , insbesondere von 
DNA, ist als ein Schliisselverf ahren der modernen Biowissen- 
schaften und der modernen Biotechnologie anzusehen. In letzter 
Zeit gerat mit der standigen Verfeinerung der Sequenzierungs- 
techniken auch die Analyse von ganzen, komplexen Genomen in den 
Bereich des Moglichen. 

Neben einigen weniger popularen Methoden werden heutzutage vor 
allem zwei grundsatzlich unterschiedliche Methoden zur Sequenz- 
analyse angewandt , und zwar 

- die Sequenzierung durch chemische Modi f izierung und Abbau 
(Maxam/Gilbert-Methode ) sowie 

- die Sequenzierung durch kontrollierten Polymerase-Einbau 
unterschiedlicher Nucleotide (Sanger-Methode); vgl . beispiels- 
weise Gassen & Schafer, Sequenzbestimmung von Nucleinsauren und 
Proteinen, in: Gassen et al , Gentechnik, 2. Auflage, Gustav- 
Fischer-Verlag, 1987, Seite 241 ff. 

Die Sanger-Methode kann sowohl mit einzelstrangiger DNA f die 
speziell fur den Zweck der Sequenzierung hergestellt wird, als 
auch seit wenigen Jahren mit jeder ausreichend reinen doppel- 
strangigen DNA durchgefuhrt werden. Ein durchgehendes Wesens- 
merkmal der Sanger-Methode bleibt jedoch unter anderem die Ab- 
hangigkeit der verwendeten Einbauenzyme ( DNA-Polymerasen ) sowohl 
von einer Matrize (Teraplat = zu sequenzierende DNA) als auch von 
einem Startraolekul (Primer). Der Primer ist in der Regel ein 
kurzes, chemisch synthetisiertes Oligonucleotid , das in seiner 
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ganzen Lange zu einem 3' von dem zu sequenzierenden DNA-Ab- 
schnitt gelegenen Teilstiick basenkomplementar ist: 



5' 



Primer 

zu sequenzieren 



3' 



Die Anheftungsstelle ( Hybridisierungsstelle ) des Primers mu(3 
derart gewahlt sein, daS unter den experimentellen Bedingungen 
der Primer nur die gewunschte und keine einzige weitere An- 
heftungsstelle findet, urn ein lesbares Sequenzierungsergebnis 
erreichen zu konnen. Die Spezifitat des Primers hangt direkt von 
seiner Lange und der Komplexitat der im Experiment verwendeten 
DNA ab. Aus statistischen Erwagungen und praktischer Erfahrung 
ergibt sich, daB Primer mit einer Kettenlange von bis zu 24 
Basen fur alle denkbaren Falle ausreichen sollten. 

Bei der Sequenzanalyse sehr langer DNA ( beispielsweise bei Ge- 
nomsequenzierungen) werden gegenwartig im wesentlichen zwei ver- 
schiedene Strategien verfolgt. 

Strategie 1: Die Ein-Primer-Methode . Hierbei wird die zu sequen- 
zierende DNA (je nach Verf ahrensvariante ) mehr oder weniger in 
Zufallsfragmente oder teilweise geordnete Fragmente zerlegt, 
wonach die Fragmente in ein und denselben Vektor inseriert 
werden. Nach Transformation von Zellen werden DNA-Praparationen 
von einzelnen Klonen hergestellt und der Sequenzanalyse unter- 
worfen. Da sich alle DNA-Praparationen maximal urn die inserierte 
DNA unterscheiden, kann fur alle anstehenden Sequenzanalysen im 
Prinzip ein einziger Primer verwendet werden, der beispielsweise 
direkt neben der Insertionsstelle auf der Vektor-DNA hybridi- 
siert. Diesem Vorteil stehen jedoch auch erhebliche Nachteile 
gegeniiber , 
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- denn da die Klone zufallig ausgesucht werden mussen, werden 
einzelne Abschnitte der Original-DNA 3ehr oft weit haufiger als 
notig sequenziert, und 

- schlieBlich klaffen in der mit Hilfe von geeigneten Computer- 
Programmen zu einer Gesamtsequenz geordneten Sammlung der Teil- 
sequenzierungsergebnisse haufig betrachtliche Liicken, da bei- 
spielsweise gewisse Abschnitte der zu analysierenden Original- 
DNA "schwer klonierbar" sind. 

Strategie 2: Die Mehr-Pr imer-Methode . Die zu sequenzierende DNA 
wird hier nicht wie bei Strategie 1 nach der SchrotschuG-Me- 
thode, sondern gezielt progressierend analysiert. Der in einem 
Experiment noch sicher zu entschliisselnde Sequenzabschnitt dient 
zur Auswahl einer Primer-Anhef tungsstelle fiir das nachste Ex- 
periment und so fort. Der Vorteil dieser Methode liegt vor allem 
darin, da0 unndtige Mehrf achsequenzanalysen wie bei der 
Strategie 1 vermieden werden. Der wohl wesentliche Grund, warum 
diese Methode nicht allein fiir die Analyse langer DNA-Abschnitte 
verwendet wird, liegt in der Beschrankung durch die gegenwartig 
verfiigbaren Methoden zur chemischen DNA-Synthese . 

Es hat nicht an Versuchen gefehlt, die jeweiligen Nachteile der 
oben beschriebenen Verfahren zu mildern, beispielsweise durch 
das "Multiplex-Sequencing 11 bei Strategie 1 und das simultane 
progressierende Sequenzieren von verschiedenen Stellen aus bei 
Strategie 2. Ein Weg, den wesentlichen Nachteil der Strategie 2 
ganz zu beseitigen, liegt theoretisch darin, eine Bank aller 
denkbaren Primer anzulegen. Dies ist jedoch durch direkte che- 
mische Synthese praktisch nicht raoglich, da es allein 4 24 ver- 
schiedene Primer der Kettenlange 24 gibt. 

Erf indungsgemaP wird daher vorgeschlagen , kiirzere, chemisch syn- 
thetisierte Oligonucleotide zu verwenden. Da jede langere Se- 
quenz im Prinzip aus zwei oder mehr kiirzeren Sequenzen zusammen- 
setzbar ist, werden die dem gewiinschten Primer entsprechenden 
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kurzen Oligonucleotide anstelle des gewunschten Primers zu der 
zu sequenzierenden DNA gegeben und durch eine 

geeignete Prozedur, beispielsweise mit T4-DNA-Ligase , zu dem 
gewunschten Primer zusammengefiigt . Die Sequenzierungsreaktion 
kann dann anschlieBend praktisch unter Standardbedingungen 
durchgefuhrt werden. 

Die der Erfindung zugrundeliegende Aufgabe wird durch die Gegen- 
stande der Anspriiche gelost. 

Beispiel 1 

In typischen Experimenten wurden ca. 2,5 pMol DNA des Plasmids 
pTZ18R (Pharmacia-LKB) mit NaOH denaturiert , mit Ethanol ge- 
fallt, getrocknet und in Wasser aufgenommen. Die DNA-Ldsung 
wurde mit je 2,5 pMol zweier verschiedener Oligonucleotidlosun- 
gen versetzt. Die Oligonucleotide der Kettenlange 8 (Octamere) 
waren derart gewahlt, da0 sie unraittelbar benachbart auf einera 
Abschnitt bekannter Nucleotidsequenz der Plasmid-DNA hybridi- 
sieren konnten. Das 5 * -Ende des im hybridisierten Zustand be- 
nachbart zum 3 '-Ende des anderen Oligonucleotids gelegenen 
Octamers war zuvor nach gangigen Verfahren mit T4-Polynucleotid- 
Kinase und ATP phosphoryliert worden. Nach Einstellen der be- 
kannten Puf f erbedingungen fur Ligationen mit T4-DNA-Ligase und 
Versetzen mit 1 Einheit des Enzyms wurde die Losung (10 ul End- 
volumen) 4 h lang bei 15 °C inkubiert. Diese Ligationslosung 
wurde vor der Sequenzierung 5 min lang bei 37 °C aufbewahrt, urn 
moglichst viele durch Ligation entstandene 16-mere und moglichst 
wenige 8-mere hybridisieren zu lassen. 

Die folgende Sequenzierung sollte dazu dienen, die Sequenz des 
gewahlten Vektors zu uberprufen. Fur die Sequenzierungsreaktion 
nach dem Standardprotokoll der Firma United States Biochemical 
Corporation (USB) wurden 8 ul der Ligationslosung eingesetzt. 
Abweichend von diesem Protokoll wurde auf das "Annealing" von 
Templat und Primer verzichtet. 
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Sofern die genannte Phosphorylierung in Gegenwart von (gamma- 
32 P]ATP durchgeftihrt worden war, wurde auf die spatere 
Verwendung von [a- 32 P]dATP verzichtet. 
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Patehtanspriiche 



1. Oligonucleotidbank, urafassend alle denkbaren 4« verschie- 
denen hexameren Oligonucleotide. 

2. Oligonucleotidbank, umfassend alle denkbaren 4* verschie- 
denen heptameren Oligonucleotide. 

3. Oligonucleotidbank, umfassend alle denkbaren 4* verschie- 
denen octaraeren Oligonucleotide. 

4. Oligonucleotidbank, umfassend alle denkbaren 49 verschie- 
denen Oligonucleotide. 

5. Verfahren zur DNA-Sequenzierung nach der Mehr-Primer- 
Methode, dadurch gekennzeichnet, da3 man 

(a) bei der zu sequenzierenden DNA eine einzelstrangige 
Primeranheftungsstelle bekannter Sequenz wahlt, 

(b) auf dieser Primeranheftungsstelle unmittelbar benachbart 
ZW ei hexamere, heptamere oder octamere Oligonucleotide (bei- 
spielsweise einer Oligonucleotidbank gemaB einem der vorher- 
gehenden Anspruche 1 bis 4) hybridisiert und 

(c) ggf. gleichzeitig mit Stufe (b) oder nach Stufe (b) ein 
weiteres hexameres, heptameres oder octameres Oligonucleotid 
(beispielsweise einer Oligonucleotidbank gema0 einem der 
vorhergehenden Anspruche 1 bis 4 ) unmittelbar benachbart zu 
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